هم ترازی جملات دادگان فارسی-عربی با روش مبتنی بر واژه نامه دوزبانه
پایان نامه
- دانشگاه تربیت معلم - تهران - دانشکده مهندسی برق و کامپیوتر
- نویسنده محمد ابرونتن
- استاد راهنما رویا امجدی فرد
- سال انتشار 1392
چکیده
امروزه با گسترش یافتن وسایل ارتباط جمعی به ویژه اینترنت، نیاز و علاقه به ترجمه خودکار، افزایش یافته است. روش ها و سیستم های مختلفی برای ترجمه ماشینی به وجود آمده است که در سال های اخیر، روش ترجمه ماشینی آماری مطرح ترین آن ها می باشد. پیکره های چندزبانه، یکی از اساسی ترین منابع شاخه های مختلفی از پردازش زبان طبیعی مانند بازیابی اطلاعات چندزبانه و ترجمه ماشینی آماری می باشد. پیکره های چندزبانه انواع مختلفی دارند که پیکره موازی مطلوب ترین آن ها برای ترجمه ماشینی، می باشد. پیکره موازی موردنیاز سیستم ترجمه ماشینی آماری بایستی در سطح جمله تراز شده باشد. روش های مختلفی برای هم ترازی جملات وجود دارد که می توان به روش های مبتنی بر طول، مبتنی بر واژه نامه، ترکیبی و ... اشاره کرد. در این تحقیق، روشی مبتنی بر واژه نامه، برای هم ترازی پیکره های فارسی-عربی که دارای حالات هم ترازی چند به یک و چند به چند زیادی می باشد ارائه شده است. واژه نامه دوزبانه حجیمی با استفاده از پیکره های موازی موجود، تولید شده و با استفاده از ریشه یاب فارسی و عربی این واژه نامه غنی و کامل تر می گردد. در این روش، پس از به دست آوردن ماتریس شباهت جملات، برای یافتن جملات مشابه هر جمله، از گراف دوقسمتی استفاده می شود. این رهیافت علاوه بر حالت های ساده 1-1 و 1-0 موارد پیچیده تر را نیز (حالت های چند به یک و چند به چند) تشخیص داده و ترازبندی می کند.
منابع مشابه
بررسی کارآمدی روش های موجود در بازیابی اطلاعات بین زبانی فارسی- انگلیسی با استفاده از واژه نامه دوزبانه ماشین خوان
در این پژوهش میزان تأثیر انجام پردازش های زبان طبیعی بر روی ترجمه عبارت های جستجو با آزمون فرضیه های پژوهش مشخص گردید. فنون پردازش زبان طبیعی که برای پردازش عبارت های جستجو به کار گرفته شد شامل قطعه بندی متن، شناخت گونه های زبانشناختی، حذف سیاهه بازدارنده، تحلیل مورفولوژیک، و برچسب زنی انواع نقش دستوری بود. آزمون فرضیه اول نشان داد که استفاده از روش ترجمه اولین برابرنهاده در مقایسه با شیوه انتخ...
متن کاملادیبان دوزبانه سلجوقی و تحولات زبان فارسی و عربی
زبان فارسی و عربی، به سبب همجواری و تعاملات دوسویه، از دوره باستان تا کنون، بر اثر مناسبات فرهنگی و سیاسی بسیار از یکدیگر متأثر شدهاند. اما در قرن پنجم هجری خاصه در عصر سلجوقیان به سبب رقابتهای علمی و ادبی میان شاهزادگان و امیران ولایتهای مختلف این تأثیرپذیری و اختلاط وارد بسیاری از واژههای دو زبان شد که نهایتاً به تکامل تدریجی آنها منجر گردید. این پژوهش بر اساس منابع ادبی و تاریخی، نیز تح...
متن کاملواژه های هم بنیاد فارسی
در زبان فارسی امروز واژگانی وجود دارد که از فارسی باستان و اوستایی، با تحولاتی که از دو طریق زبان پهلوی اشکانی و پهلوی ساسانی یافته، به دو و گاهی سه صورت به زبان فارسی امروز رسیدهاند که در فرهنگهای فارسی پس از اسلام، به سبب عدم شناخت و چگونگی تحول آنها، هر یک چون واژهای مستقل به کار رفتهاند و هیچیک از فرهنگنویسان اشارهای به یک اصل داشتن آنها نکردهاند. تنها گهگاه برخی، آنها را واژههای م...
متن کاملمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
نوع سند: پایان نامه
دانشگاه تربیت معلم - تهران - دانشکده مهندسی برق و کامپیوتر
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023